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Beschreibung 

Prozessor mit interner Speicherkonf iguration 

Die vorliegende Erfindung bezieht sich auf Computerarchitek- 
turen und insbesondere auf Prozessorarchitekturen mit einer 
arithmetischen Einheit und einem Registerspeicher . 

Fig. 3 zeigt eine bekannte Prozessorarchitektur am Beispiel 
eines Coprozessors . Der Coprozessor umfafit eine arithmetische 
Einheit 300, einen Registerspeicher 310 und ein Controlteil 
320. Die arithmetische Einheit 300, der Registerspeicher 310 
fur Operanden fur die arithmetische Einheit sowie der Con- 
trolteil 320 sind physisch auf einem Coprozessor 330 unterge- 
bracht. Der Coprozessor steht liber einen Verbindungsbus 340 
mit einem externen Bus 350 in Verbindung. Ebenfalls mit dem 
externen Bus 350 verbunden ist ein externer Speicher 360, ei- 
ne Host-CPU (nicht gezeigt) sowie Eingabe/Ausgabe- 
Schnittstellen (nicht gezeigt) etc. 

Die arithmetische Einheit ist mit dem Registerspeicher liber 
einen internen Bus 370 verbunden. Der Controlteil 320 kann 
liber Steuerleitungen 380a, 380b mit dem Registerspeicher 310 
bzw. der arithmetischen Einheit 300 kommunizieren . Wie es be- 
kannt ist, ist die arithmetische Einheit (AU) 300 ausgebil- 
det, urn Befehle auf Operanden, die in dem Registerspeicher 
310 gespeichert sind, auszufiihren. Hierzu steuert der Con- 
trolteil 320 den Registerspeicher 310, urn die Operanden, die 
von einem speziellen durch die AU 300 auszuf uhrenden Befehl 
benotigt werden, in die AU hinein zu laden, damit der Befehl 
auf die Operanden ausgefuhrt werden kann. Das Ergebnis der 
arithmetischen Operation wird uber den internen Bus 370 wie- 
der zuriick in den Registerspeicher geschrieben, urn von dort 
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auf Veranlassung des Controlteils 320 wieder fur einen nach- 
sten Befehl zur Verfugung zu stellen, oder urn uber den Ver- 
bindungsbus 340 zu dem externen Speicher gebracht zu werden. 
Typischerweise ist fur einen S tandardprozessor der Register- 
5 speicher so ausgelegt, daft er eine bestimmte Anzahl von Regi- 
stern hat, die fur ubliche, durch die arithmetische Einheit 
auszufuhrende Berechnungen benotigt werden. Ist der Prozessor 
ein Allzweckprozessor, so werden je nach zu berechnendem Al- 
gorithmus bestimmte Register des Registerspeichers 310 bend- 
10 tigt werden, wahrend andere Register, die von einem bestimm- 
ten Algorithmus nicht benotigt werden, ungenutzt sind. 

{* 

Wird dagegen fur eine Berechnung eine grofiere Anzahl von Re- 
gistern benotigt, als sie im Registerspeicher 310 vorhanden 

15 sind, so werden die Operanden, die im Registerspeicher 310 
nicht Platz haben, im externen Speicher 360 abgespeichert . 
Wenn die arithmetische Einheit 300 fur ihre Berechnungen Da- 
ten benotigt, die nicht im Registerspeicher 310 vorhanden 
sind, so mussen diese Operanden aus dem externen Speicher 360 

20 liber den Verbindungsbus 340 geladen werden. Im Gegensatz zu 
dem Datenverkehr auf dem internen Bus 370, der aufgrund der 
Konf iguration des internen Busses und nicht zuletzt aufgrund 
der kurzen physikalischen Langen sehr schnell ablauft, be- 
steht fur einen Datenverkehr zwischen dem externen Speicher 

25 360 und der arithmetischen Einheit 300 ein hoher Aufwand. 

Dieser Aufwand aufiert sich wie gesagt durch die langere Uber- 
tragungszeit der Daten aufgrund der typischerweise physika- 
lisch viel grofteren Langen des externen Busses und des Ver- 
bindungsbusses 340 sowie in der Signalisierung, urn einen Ope- 

30 randentransf er vom externen Speicher 360 zu der arithmeti- 
schen Einheit 300 bzw. einen Operandentransf er von der arith- 
metischen Einheit 300 zuriick zu dem externen Speicher 360 zu 
signal is ieren . 
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Insbesondere bei sicherheitsrelevanten Anwendungen, d. h. 
wenn der Coprozessor 330 ein Kryptocoprozessor ist und bei- 
spielsweise auf einer Chipkarte implementiert ist oder Teil 
eines Sicherheits- ICs bildet, existiert ferner ein Sicher- 
heitsproblem, wenn Operanden vom externen Speicher 360 uber 
den externen Bus in die arithmetische Einheit 300 und zuriick 
geladen werden mussen. Fur einen Angreifer ist es einfacher, 
den externen Bus auf dem Chip zu lokalisieren und "anzuzap- 
fen", als den internen Bus 370 herauszuf inden und anzuzapfen. 
Ein Grund dafiir ist die typischerweise regelmaftige Anordnung 
des externen Busses 350 auf dem Chip sowie die wesentlich 
groflere Lange des externen Busses im Vergleich zum internen 
Bus 370 des Coprozessors . Insbesondere wenn der Coprozessor 
15 selbst als integrierte Schaltung implementiert ist, ist die 
physikalische Lange des externen Busses 370 sehr klein, so 
dafi ein Abhoren dieses Busses nahezu unmoglich ist. Ganz an- 
ders sieht es dagegen fur den externen Bus 350 aus, welcher 
uber eine I/O-Schnittstelle mit dem Coprozessorchip verbunden 
20 sein mufl . 

/ Hinsichtlich der Auslegung des Registerspeichers 310 wird ub- 

<^ licherweise eine nicht zu grofie Registerspeicherkapazitat 

verwendet, da bei Algorithmen, die lediglich eine kleine An- 
25 zahl von Operanden benotigen, ein grower Teil des Register- 
speichers 310 ungenutzt sein wurde, d. h. brach liegen wurde. 
Registerspeicherzellen sind, insbesondere wenn eine grofte An- 
zahl derselben auf einem Chip untergebracht werden mufl, rela- 
tiv platzaufwendig . Urn beispielsweise einen Kryptocoprozessor 
klein zu halten, wird daher die Anzahl der Regis terzellen 
klein gehalten, urn den Fall zu vermeiden, daii dauernd Regi- 
sterspeicherplatz ungenutzt brach liegt und dennoch auf dem 
Chip Platz verbraucht. Es wird daher im Sinne der Platzeffi- 
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zienz des Chips bewuftt in Kauf genommen, daft fur Algorithmen, 
die mehr Operanden benotigen, als Platz im Registerspeicher 
vorhanden ist, eine hohe Anzahl von Operandentransf ers vom 
externen Speicher 360 in den Coprozessor 330 stattfinden muJ3 . 

Insbesondere bei einer Chipkarte, bei der der Arbeitsspeicher 
ohnehin sehr knapp ist und aufgrund der Groflenbeschrankungen 
der Chipkarte vielleicht im Bereich von 2 bis 8 Kilobyte 
liegt, wird iiblicherweise der Registerspeicher 310 eines Pe- 
ripherieelements, wie z. B. des Coprozessors 330, eines Zu- 
i; fallszahlengenerators, eines Hash-Moduls, eines Moduls fur 
^ eine symmetrische Kryptographie (DES, AES) oder eines anderen 
Peripheriegerats, sehr klein gewahlt, damit fur die Funktio- 
nalitat der Chipkarte ein ausreichender Arbeitsspeicher 
15 (XRAM) zur Verfugung bleibt. Ferner wird darauf hingewiesen, 
dali die Chipkarte auch noch einen Festwertspeicher (ROM) so- 
wie einen nicht-f liichtigen beschreibbaren Speicher (EEPROM, 
Flash, etc.) umfassen muB, so dafi, urn die Plat zanf orderungen 
des Chips auf der Chipkarte zu erfullen, der Registerspeicher 
310 iiblicherweise so klein als irgendwie vertretbar ausge- 
fuhrt wird. 



20 



h 

^ Dies wird jedoch, wie es ausgefiihrt worden ist, durch Sicher- 
heitskompromisse und Zeitverluste aufgrund des Operanden- 
25 transfers zwischen dem externen Speicher 360 und der arithme- 
tischen Einheit 300 erkauft. 

Die Aufgabe der vorliegenden Erfindung besteht darin, einen 
sicheren und schnellen Prozessor sowie ein sicheres und 
30 schnelles Rechnersys tern zu schaffen. 



Diese Aufgabe wird durch einen Prozessor nach Patentanspruch 
1 Oder durch ein Rechnersys tern nach Patentanspruch 9 geldst. 
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Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, dafi 
eine Erhdhung der Sicherheit und eine Zeitersparnis sowie An- 
forderungen an eine gute Speicheref f izienz dadurch erreicht 
werden konnen, daJ5 der Regis terspeicher so groB ausgelegt 
wird, da/5 fur die uberwiegende Anzahl von Algorithmen, die 
der Prozessor ausfuhren muB, die hierfur erf orderlichen Ope- 
randen in dem Registerspeicher gespeichert werden konnen, und 
daJi der in dem Registerspeicher noch verbleibende Speicher- 
platz fur andere Daten als die Operanden, also beispielsweise 
als Arbeitsspeicher, zur Verfiigung gestellt wird. 



Hierzu wird gemaB der vorliegenden Erfindung eine Register- 
speicherkonfigurationseinheit eingesetzt, die den Register- 
15 speicher so konf iguriert , daI3 die benotigte Anzahl von Ope- 
randen fur einen Algorithmus, den die arithmetische Einheit 
berechnen muli, in dem Registerspeicher abgespeichert werden 
kann, und dafi der Rest des Registerspeichers im Gegensatz zum 
Stand der Technik nicht „brach liegt", sondern fur andere Da- 
20 ten als die Operanden zur Verfiigung gestellt wird. Die Regi- 
sterspeicherkonf igurationseinheit baut bevorzugterweise auf 
( einem Adressierungsverf ahren auf, das ein Memorymapping 

1^ durchfiihrt, so daB der freie Teil des Registerspeichers in 
das XRAM eingemapped ist, obgleich der freie Teil physika- 
25 lisch direkt im Registerspeicher fur die arithmetische Ein- 
heit des Prozessors vorhanden ist. 

Bei einem bevorzugten Ausf uhrungsbeispiel der vorliegenden 
Erfindung ist der Prozessor ein Kryptoprozessor , und ist die 
arithmetische Einheit ein Langzahlrechenwerk fur Operanden 
bis zu 2048 Bit Lange, so daft ein erheblicher Registerspei- 
cher bereit gestellt werden mufi>, wenn beispielsweise funf 
Operanden einer solchen Lange benotigt werden. Bei einem be- 
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vorzugten Ausf uhrungsbeispiel ist der Prozessor fur verschie- 
dene kryptographische Algorithmen ausgebildet, unter denen 
durchaus ein Algorithmus sein kann, der weniger Operanden 
bzw. Operanden mit einer sehr viel kurzeren Lange benotigt. 
Wenn beispielsweise eine RSA-Signatur betrachtet wird, fur 
die optimalerweise fur die modulare Exponentiation vier Regi- 
ster mit einer Lange von 2048 Bit benotigt werden, und wenn 
gleichzeitig eine Elliptische-Kurven-Kryptographieanwendung 
(z. B. EC-DSA) betrachtet wird, bei der z. B. zur Berechnung 
einer elektronischen Signatur 11 Register mit einer Lange von 
190 Bits gebraucht werden, so wurde trotz der grofieren Anzahl 
von Operanden bei der Elliptische-Kurven-Kryptographie nahezu 
1 Kilobyte an Registerspeicher brach liegen, was insbesondere 
dann problematisch ist, wenn der gesamte Arbeitsspeicher 
(XRAM) ohnehin nur zwischen 2 und 8 Kilobyte liegt. Erfin- 
dungsgemaB wird durch die Speicherkonf igurationseinheit der 
in dem Registerspeicher nicht benotigte Platz in das XRAM 
eingemapped, so daft der Prozessor diesen Speicher als Ar- 
beitsspeicher verwenden kann, oder, wenn an eine Chipkarte 
als Rechnersystem gedacht wird, dieser Speicher auch von an- 
deren Komponenten der Chipkarte benutzt werden kann. Anderer- 
seits kann nun, aufgrund der vorliegenden Erfindung, der Re- 
gisterspeicher so grofi ausgelegt werden, dafi er samtliche 
Operanden fur den Kryptoalgorithmus aufnehmen kann, der den 
meisten Regis terspeicherplatz fur seine Operanden benotigt. 
Falls namlich ein Algorithmus ausgefiihrt wird, der eine we- 
sentlich geringere Anzahl von Registerspeichern benotigt, 
kann der nicht benotigte Registerspeicher einfach als Ar- 
beitsspeicher zur Verfugung gestellt werden und liegt nicht 
brach . 

Fur den Fall, daft der er f indungsgemaBe Prozessor als Krypto- 
coprozessor in Form eines Per ipher ieelements auf einer Chip- 
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karte ausgefiihrt wird, kann bei einem bevorzugten Ausfiih- 
rungsbeispiel der vorliegenden Erfindung die Registerspei- 
cherkonf igurationseinheit so ausgebildet sein, dafi der gesam 
te Registerspeicher des Kryptocoprozessors fur andere Peri- 
pherieelemente der Chipkarte oder fiir die Host-CPU als Ar- 
beitsspeicher zur Verfugung gestellt wird, wenn die arithme- 
tische Einheit des Kryptocoprozessors gerade nicht aktiv ist 
Damit kann insbesondere bei einem Chipkarten-IC, bei der auf 
grund einer maximalen Chipgrofie sehr enge Speicherressourcen 
zur Verfugung sind, sichergestellt werden, dafi immer der ge- 
samte Speicher der Chipkarte, unabhangig davon, ob er als ex 
terner Speicher oder als Registerspeicher ausgefiihrt ist, in 
Betrieb ist bzw. fiir Anwendungen zur Verfugung gestellt wer- 
den kann . 



Es sei darauf hingewiesen, daB der interne Bus die voile 
Breite des Rechenwerks hat, wahrend der auBere Bus eine nor- 
male Breite hat, wie z. B. 8, 16 oder 32 Bits. Bei einem 
Langzahlrechenwerk hat der interne Bus dagegen z. B. eine 
Breite von 1024 Bits. Daraus wird deutlich, dali ein Operan- 
dentransfer eines Langzahloperanden vom Speicher liber den ex 
ternen Bus mehrere Buszyklen braucht und damit zeit- und ver 
^ waltungsaufwendig ist, wahrend dieser Operand auf dem inter- 
nen - breiten - Bus ohne weiteres einfach iibertragen werden 
25 kann. 

Bevorzugte Ausf uhrungsbeispiele der vorliegenden Erfindung 
werden nachfolgend bezugnehmend auf die beiliegenden Zeich- 
nungen detailliert erlautert. Es zeigen: 



Fig. 1 ein Blockschaltbild eines er f indungsgema/ien Prozes- 
sors bzw. eines er f indungsgemaften Rechnersys terns ; 
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Fig. 2 eine Symboldarstellung der Speichersituation bei 
einem bevorzugten Ausf uhrungsbeispiel der vorlie- 
genden Erfindung, bei dem ein Teil des Register- 
speichers des Coprozessors in den Arbeitsspeicher 
des Rechnersystems eingemapped ist; und 

Fig. 3 eine bekannte Prozessorarchitektur . 

Fig. 1 zeigt einen erf indungsgemafien Prozessor. Der Prozessor 
umfafit eine arithmetische Einheit 10, einen Registerspeicher 
12, einen internen Bus 14 zwischen dem Registerspeicher 12 
N und der arithmetischen Einheit 10, einen weiteren internen 

Bus 14' zwischen der arithmetischen Einheit 10 und dem Regi- 
sterspeicher 12, urn Ergebnisse der arithmetischen Einheit 
15 wieder in den Registerspeicher 12 einspeisen zu konnen, eine 
Steuereinheit 16, die liber Steuerleitungen den Betrieb der 
arithmetischen Einheit 10 und den Betrieb des Registerspei- 
chers 12 steuern kann, einen externen Bus 18 zur Kommunikati- 
on mit Peripheriegeraten, wie z. B. einer Eingang/Ausgang- 
20 Schnittstelle, einem anderen Prozessor, etc., und eine Regi- 
sterspeicherkonf igurationseinheit 20. Die Registerspeicher- 
4 konf igurationseinheit 20 kann uber eine Speicherkonf igurati- 

^ onsleitung 22 den Registerspeicher 12 erf indungsgemafi konfi- 
gurieren . 



25 
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Wie es in Fig. 1 gezeigt ist, ist der Registerspeicher 12 so 
konf iguriert, dafi er einen Speicherabschnitt 12a hat, in dem 
die Register fur die arithmetische Einheit 10 konfiguriert 
werden konnen, und dafi er einen weiteren freien Speicherab- 
schnitt 12b hat, auf den mittels eines Regis terspeicherbusses 
24 uber den externen Bus Daten eingeschrieben oder Daten aus- 
gelesen werden konnen. 
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Vorzugsweise ist der Registerspeicher 12 so grofi konfigu- 
riert, dafi fiir alle Rechenauf gaben, die von der arithmeti- 
schen Einheit 10 durchgefiihrt werden konnen, geniigend Regi- 
ster fiir die von der arithmetischen Einheit 10 benotigten 
Operanden zur Verfugung gestellt werden konnen. Wenn die Re- 
chenaufgabe, die durch die arithmetische Einheit 10 zu bewal- 
tigen ist, sehr viel Registerspeicherplatz benotigt, wird die 
Registerspeicherkonfigurationseinheit 20 den Registerspeicher 
so konfigurieren, dafl der gesamte Registerspeicher 12 ahnlich 
einem ublichen Registerspeicher zur Speicherung der Operanden 
fiir die arithmetische Einheit 10 dient . In anderen Worten 
ausgedriickt wird eine Speicherauf teilungsgrenze 26 symbolisch 
ausgedriickt ganz nach links in Fig. 1 verschoben, so daft der 
freie Speicher 12b Null ist, wahrend der Speicher fur Operan- 
den fiir die arithmetische Einheit 12a den gesamten Register- 
speicher 12 ausfiillt. Mufi die arithmetische Einheit 10 dage- 
gen eine Rechenauf gabe bewaltigen, bei der nur sehr wenig 
Operanden und insbesondere auch beispielsweise sehr kurze 
Operanden benotigt werden, so wird die Registerspeicherkonf i- 
gurationseinheit 20 den Registerspeicher so konfigurieren, 
dafi die Operandenregister von dem Registerspeicher 12 zur 
Verfugung gestellt werden, dafi jedoch der Rest des Register- 
speichers als freier Speicher 12b konfiguriert wird, in den 
andere Daten eingeschrieben werden konnen. Nachdem der Regi- 
sterspeicher 12 typischerweise ein fliichtiger Speicher ist, 
wird der freie Speicherplatz 12b des Registerspeichers 12 dem 
Prozessor als Arbeitsspeicher , z. B. als XRAM, zur Verfugung 
gestellt. Die Speicherauf teilungsgrenze 26 wird dann irgendwo 
in der Mitte des Registerspeichers 12 liegen und den Fall re- 
prasentieren, der in Fig. 1 gezeichnet ist. 

Ist der in Fig. 1 gezeichnete Prozessor beispielsweise als 
Coprozessor ausgefuhrt und iiber den externen Bus 18 mit einer 
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Host-CPU verbunden, so ist die Registerspeicherkonf igurati- 
onseinheit 20 bei dem bevorzugten Ausf iihrungsbeispiel der 
vorliegenden Erfindung so ausgebildet, dai3 die Speicherauf- 
teilungsgrenze 26 bezugnehmend auf Fig. 1 ganz nach rechts 
verschoben wird, und zwar in dem Fall, in dem die arithmeti- 
sche Einheit 10, die einen Teil des Coprozessors bildet, 
nicht aktiv ist. Dieser Fall ist denkbar, wenn lediglich die 
Host-CPU arbeitet, jedoch nicht der in Fig. 1 gezeigte Copro- 
zessor. Dann wird der Registerspeicher 12 des Coprozessors 
vollstandig der Host-CPU des Prozessorsystems zur Verfiigung 
gestellt. Da die arithmetische Einheit 10 gerade nicht aktiv 
ist, benotigt sie auch keine Operandenregister im Register- 
speicher. Im Gegensatz zum Stand der Technik, bei dem der Re- 
gisterspeicher 12 immer dann brach liegt, wenn die arithmeti- 
sche Einheit 10 gerade nicht aktiv ist, wird erf indungsgemaft 
der Registerspeicher 12 aufgrund der Handlungen der Register- 
speicherkonf igurationseinheit 20 einer in Fig. 1 nicht ge- 
zeigten Host-CPU zur Verfiigung gestellt. 

Diese Mafinahme ist besonders bei Prozessorsystemen mit sehr 
begrenzten Speicherressourcen vorteilhaft, wie sie beispiels- 
weise bei einer Chipkarte Oder einem Sicherheits-IC zu finden 
sind. Am Beispiel einer Chipkarte, die neben einer Host-CPU 
einen Kryptocoprozessor sowie weitere Peripheriegerate sowie 
einen nicht-f liichtigen Speicher (E2PROM) , einen f luchten Ar- 
beitsspeicher (z. B. XRAM) oder einen Nur-Lese-Speicher (ROM) 
aufweist, ist zu sehen, daft das Zur-Ver f ugung-Stellen von 
freien Teilen des Registerspeichers bzw. gegebenenf alls das 
Zur-Verfugung-Stellen des gesamten Registerspeichers des 
Kryptocoprozessors die Speicherressourcen erheblich vergro- 
ftert werden konnen. Die gesamte Speicherkapazitat einer Chip- 
karte kann bei vielleicht 5 Kilobyte liegen, wahrend der Ar- 
beitsspeicher zwischen 2 und 3 Kilobyte groft ist. Der Krypto- 
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coprozessor benotigt typischerweise einen relativ groften Re- 
gisterspeicher, da mehrere Langzahloperanden, wie z. B. 4 
Langzahloperanden mit einer Lange von jeweils 2048 Bit, fur 
sichere RSA-Berechnungen benotigt werden. Wird dieser zusatz 
liche Speicher von etwa 1 Kilobyte zur Verfugung gestellt, 
wenn der Kryptocoprozessor nicht aktiv ist, so kann der Ar- 
beitsspeicher (XRAM) fiir die Host-CPU um bis zu 1/3 vergro- 
fiert werden, ohne daft zusatzliche Speicherzellen zur Verfii- 
gung gestellt werden miissen. 



Andererseits hat die Implementierung eines groften Register- 
speichers den Vorteil, daft die arithmetische Einheit optimal 
mit Operanden versorgt werden kann, wobei der Operandentrans- 
fer lediglich iiber den internen Bus 14 (Fig. 1) statt findet, 
ohne daft Operanden iiber den externen Bus der arithmetischen 
Einheit zugefuhrt werden miissen, wie es im Stand der Technik 
der Fall ist. Damit jedoch fur andere Algorithmen, die nicht 
so viel Registerspeicher benotigen, der nicht benotigte Regi- 
sterspeicher nicht "brach liegt", ist die Registerspeicher- 
konf igurationseinheit erf indungsgemaft vorgesehen, um den Re- 
gisterspeicher in einen freien Speicherteil 12b und einen Re- 
gisterspeicherteil fiir die arithmetische Einheit 12a zu kon- 
f igurieren . 



Im nachfolgenden wird auf Fig. 2 eingegangen, um das erfin- 
dungsgemafte Einmappen des freien Speicherplatzes 12b in den 
XRAM-Arbeitsspeicher eines Prozessorsystems darzustellen, bei 
dem die in Fig. 1 gezeigte arithmetische Einheit zusammen mit 
dem Registerspeicher (12a und 12b) und der Steuereinheit 16 
(Controller) einen Kryptocoprozessor eines Prozessorsystems 
beispielsweise auf einer Chipkarte bildet. 
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Links in Fig. 2 ist eine Speicherhierarchie 30 dargestellt , 
die einen nicht-f liichtigen Speicher in Form eines E 2 PROM, ei- 
nen Festwertspeicher in Form eines ROM sowie einen fluchtigen 
Arbeitsspeicher in Form eines XRAM bildet. Der Arbeitsspei- 
cher XRAM umfaftt sowohl den Registerspeicher 12a sowie einen 
sonstigen XRAM-Arbeitsspeicher 32, der an irgendeiner anderen 
Stelle auf der Chipkarte ausgefiihrt ist. Wie es in Fig. 2 ge- 
zeigt ist, sind in dem XRAM-Arbeitsspeicher verschiedene Re- 
gister C, N und CRi konf iguriert , wobei diese Registerspei- 
cherplatze, die durch das Bezugszeichen 12a in Fig. 2 be- 
zeichnet sind, nicht Teil des sonstigen XRAM 32 der Chipkarte 
sind, sondern ebenso wie der Speicherplat z fur das Z-Register 
physikalisch im Kryptocoprozessor angeordnet sind. Die Regi- 
ster Z, N, C und CRi werden beispielsweise fur die Berechnung 
15 von RSA-Signaturen benotigt. 

Bei dem in Fig. 2 gezeigten Ausf iihrungsbeispiel ist zu sehen, 
daft der Speicherplatz fur die Register C, N und CRi in den 
Arbeitsspeicher der Chipkarte eingemapped sind, wahrend dies 
fur das Z-Register nicht zutrifft. Falls die Registerspei- 
cherkonf igurationseinheit den Registerspeicher des Kryptoco- 
prozessors ansteuert, daft fur die Berechnung einer bestimmten 
Aufgabe keine Register C, N und CRi benotigt werden, so kann 
der Platz dieser Register aufgrund des Einmappens ohne weite- 
25 res von anderen Elementen als der ari thmetischen Einheit 10 
des Kryptocoprozessors verwendet werden. Fur das Z-Register 
von Fig. 2 trifft dies dagegen nicht zu. Unabhangig davon, ob 
das Z-Register benotigt wird oder nicht, steht dieses als Ar- 
beitsspeicher fur die Chipkarte nicht zur Verfugung. Daraus 
30 ist zu sehen, daft es fur bestimmte Anwendungen auch sinnvoll 
sein kann, nicht den gesamten Registerspeicher, der physika- 
lisch im Kryptocoprozessor vorhanden ist, in den Arbeitsspei- 
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Bezugszeichenliste 

10 arithmetische Einheit 

12 Registerspeicher 
12a Registerspeicher fur die arithmetische Einheit 
12b freier Registerspeicher 

14 interner Bus 
14' interner Bus fur Ergebnisse 

16 Control -Einheit 

18 externer Bus 

20 Regis terspeicherkonf igurationseinheit 

22 Regis ter spe iche r konfigur at ions -St euer lei tung 

24 Regis terspeicher-Verbindungsbus 

2 6 Registerspeicher-Grenzlinie 

30 Speicher schema 

32 sonstiger Arbeitsspeicher (XRAM) 
300 arithmetische Einheit 
310 Registerfelder fur Operanden 
320 Controlteil 
330 Coprozessor 

340 Verbindungsbus zwischen arithmetischer Einheit und 
externem Bus 

350 externer Bus 

3 60 externer Speicher 

370 interner Bus 
380a Steuerleitung fur die Registerfelder 
380b Steuerleitung fur die arithmetische Einheit 
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bei dem die Speicherkonf igurationseinheit (20) angeordnet 
ist, urn zu iiberprufen, ob das Peripheriegerat aktiv ist, und 
urn in dem Fall, in dem das Peripheriegerat nicht aktiv ist, 
den gesamten internen Speicher des Peripheriegerats dem Rech- 
nersystem als Arbeitsspeicher zur Verfugung zu stellen. 

13. Rechnersystem nach einem der Anspruche 9 bis 12, bei dem 
das Peripheriegerat ein Kryptocoprozessor ist. 

14. Rechnersystem nach einem der Anspruche 9 bis 13, das als 
Chipkarten-IC oder Security-IC ausgefiihrt ist. 

Zusammen fas sung 
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Prozessor mit interner Speicherkonf iguration 

Ein Prozessor umfaftt eine ari thmetische Einheit (10) zum Ver- 
arbeiten von Operanden, einen Regis terspeicher (12) zum Spei- 
chern der Operanden mit einem Registerspeicherplat z und eine 
Registerspeicherkonf igurationseinheit (20) . Die Registerspei- 
cherkonfigurationseinheit (20) ist ausgebildet, urn den Regi- 
sterspeicher so zu konf igurieren, daft den Operanden Speicher- 
platz (12a) in dem Registerspeicher (12) zugewiesen wird, und 
daJi Speicherplatz (12b) in dem Registerspeicher (12), der den 
Operanden nicht zugewiesen ist, fur andere Daten als die Ope- 
randen zur Verfugung gestellt wird. Damit wird einerseits die 
Anzahl von Operandentransf ers zwischen einem externen Bus und 
der arithmetischen Einheit verringert, da moglichst viele 
Operanden in dem Registerspeicher abgespeichert werden, wah- 
rend andererseits, falls ein Teil des Registerspeichers nicht 
zum Abspeichern von Operanden bendtigt wird, dieser Teil 
nicht brach liegt, sondern fur andere Daten zur Verfugung ge- 
stellt wird, so daft die Speicherressourcen des Prozessors im- 
mer optimal genutzt sind. 



Figur 1 



20020953 



16 



Patentanspruche 

1. Prozessor mit folgenden Merkmalen: 

5 einer ari thmetischen Einheit (10) zum Verarbeiten von Operan- 
den; 

einem Registerspeicher (12) zum Speichern der Operanden; und 

10 einer Registerspeicherkonf igurationseinheit (20), die ausge- 
t bildet ist, urn den Registerspeicher so zu konf igurieren, dafi 
& den Operanden Speicherplatz (12a) in dem Registerspeicher zu- 
gewiesen wird, und dalb Speicherplatz (12b) in dem Register- 
speicher (12) , der den Operanden nicht zugewiesen ist, fur 
15 andere Daten als die Operanden zur Verfugung gestellt wird. 

2. Prozessor nach Anspruch 1, bei dem die arithmetische Ein- 
heit (10), der Registerspeicher (12) und eine Steuereinheit 
zum Steuern der arithmetischen Einheit (10) und des Register- 

20 speichers (12) , urn Operanden von dem Registerspeicher in die 
arithmetische Einheit zu laden, und urn eine Operation mit den 
Operanden auszufuhren, als integrierte Schaltung auf einem 
einzigen Chip ausgefiihrt sind. 

25 3. Prozessor nach Anspruch 1 oder 2, bei dem die Operanden 

Langzahloperanden sind, die eine Lange von liber 150 Bits ha- 
ben . 

4. Prozessor nach einem der vorhergehenden Anspruche, der 
30 ferner einen externen Speicher und eine Adressierungseinheit 
aufweist, wobei die Adressierungseinheit ausgebildet ist, urn 
den verbleibenden Speicherplatz (12b) des Registerspeichers 
(12) wie den externen Speicher zu adressieren. 
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5. Prozessor nach einem der vorhergehenden Anspriiche, bei dem 
die arithmetische Einheit (10) ausgebildet ist, urn zumindest 
zwei Algorithmen auszufuhren, wobei ein Algorithmus aufgrund 
der Lange und/oder Anzahl seiner verwendeten Operanden eine 
maximale Menge an Registerspeicherplat z benotigt, wahrend ein 
anderer Algorithmus fur seine Operanden eine kleinere Menge 
an Registerspeicherplatz benotigt, 

wobei der Registerspeicher so dimensioniert ist, daB der Re- 
gisterspeicherplatz zumindest gleich der maximalen Menge an 
Registerspeicherplatz ist, die der eine Algorithmus fur seine 
Operation benotigt. 

6. Prozessor nach einem der vorhergehenden Anspriiche, 

der ausgebildet ist, urn einen kryptographischen Algorithmus 
auszufuhren . 

7. Prozessor nach einem der vorhergehenden Anspriiche, bei dem 
die arithmetische Einheit (10) und der Registerspeicher (12) 
iiber einen internen Bus (14) verbunden sind, 

bei dem ein externes Element mit der ari thmetischen Einheit 
(10) iiber einen externen Bus (18) verbunden ist, und 

bei dem die Lange des externen Busses (18) grofter als die 
Lange des internen Busses (14) ist. 



. Prozessor nach einem der vorhergehenden Anspriiche, 
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bei dem die Registerspeicherkonf igurationseinheit (20) ange- 
ordnet ist, urn in dem Registerspeicher je nach Bedarf Regi- 
ster unterschiedlicher Anzahl und Lange zu konf igurieren . 

9. Rechnersystem mit folgenden Merkmalen: 
einer Host-CPU; 

einem Peripheriegerat, das mit der Host-CPU iiber einen exter- 
nen Bus (18) verbunden ist, und das einen internen Speicher 
(12) aufweist; und 

eine Speicherkonf igurationseinheit (20), wobei die Speicher- 
konfigurationseinheit (20) ausgebildet ist, urn je nach Bedarf 
Platz (12a) aus dem internen Speicher (12) dem Peripheriege- 
rat zur Verfugung zu stellen, und Platz (12b) aus dem inter- 
nen Speicher, der dem Peripheriegerat nicht zur Verfugung ge- 
stellt wird, iiber einen Zugriff mittels eines externen Busses 
(18, 24) fur andere Daten zur Verfugung zu stellen. 

10. Rechnersystem nach Anspruch 9, das ferner eine Adressie- 
rungseinrichtung aufweist, wobei die Adressierungseinrichtung 
angeordnet ist, urn den internen Speicher (12b) des Periphe- 
riegerats, der dem Peripheriegerat nicht zur Verfugung ge- 
stellt wird, wie einen externen Speicher des Rechnersystems 
zu adressieren. 

11. Rechnersystem nach Anspruch 9 oder 10, 

bei dem die Registerspeicherkonf igurationseinheit (20) Teil 
des Peripheriegerats ist. 



12. Rechnersystem nach einem der Anspriiche 9 bis 11, 
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cher der Chipkarte einzumappen, sondern lediglich einen be- 
stimmten Teil. 

Im nachfolgenden wird auf verschiedene mogliche Speicherkon- 
figurationen bzw. Speicherbediirf nisse fur verschiedene kryp- 
tographische Algorithmen eingegangen. Die optimale Speicher- 
konfiguration fur einen Kryptographieprozessor ist abhangig 
von den Kryptoalgorithmen, die auf dem Kryptoprozessor be- 
rechnet werden sollen. So benotigt man beispielsweise fur ei 
ne RSA-Signatur die Register C, N, Z und ein CRi-Register , 
welche je nach Sicherheitsanf orderungen eine Lange zwischen 
jeweils 1000 bis 2500 Bit haben konnen. Es ist jedoch auch 
moglich, die RSA-Signaturberechnung zu beschleunigen, indem 
man weitere CRi-Register hinzufiigt. In den weiteren CRi- 
Registern konnen dann vorberechnete Werte abgespeichert wer- 
den, die die RSA-Signaturberechnung beschleunigen. Erfin- 
dungsgemafi wird die Registerspeicherkonf igurationseinheit 20 
den Registerspeicher 12 so konf igurieren, daft auch fur die 
weiteren CRi-Register Speicherplatz zugewiesen wird, so daJi 
der freie Speicher 12b im Vergleich zum Fall von vier Regi- 
stern kleiner wird, daJi jedoch die Berechnung vergroJiert 
wird, da auf die in den CRi-Register gespeicherten Operanden 
schnell und einfach iiber den internen Bus 14 zwischen dem Re 
gisterspeicher 12 und der arithmetischen Einheit 10 iibertra- 
gen werden konnen. Vorausset zung hierfiir ist naturlich, daft 
der Registerspeicher 12 ausreichend groft ausgefiihrt ist. Ein 
weiteres Beispiel fur eine optimale Registerspeicherkonf igu- 
ration ist die modulare Exponentiation unter Verwendung des 
"Square and Multiply "-Algorithmus . Wahlt man aus Sicherheits 
grunden identische Rechenzeiten fur Quadratur und Multiplika 
tion, so muft der Operand fur die Quadratur zweimal abgespei- 
chert werden, d. h. im Register C und in einem CRi-Register. 
Auch hier wird ein zusatzliches CRi-Register benotigt, das 
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durch die Registerspeicherkonf igurationseinheit in dem Regi- 
sterspeicher 12 konfiguriert wird. 

Eine grofie Dimensionierung des Registerspeichers ist jedoch 
hinsichtlich des Speicherplat zes unkritisch, da, wenn die ge- 
samte Menge an Speicher im Registerspeicher nicht benotigt 
wird, dennoch der Speicher nicht, wie im Stand der Technik, 
"brach" liegt, sondern durch die Speicherkonf igurationsein- 
heit 20 und den Verbindungsbus 24 uber den externen Bus fur 
anderen Komponenten des Prozessorsystems zur Verfiigung ge- 
stellt wird. 

Besteht ferner der Bedarf, elektronische Signaturen mit Hilfe 
elliptischer Kurven (EC-DSA) zu berechnen, so benotigt man 
beispielsweise in projektiven Koordinaten zusatzlich zu den 
Registern C, N und Z acht weitere Register, z. B. CRi, zur 
Abspeicherung von Kurvenparametern . 

Wenn dagegen der Kryptoprozessor nicht benutzt wird, wird der 
gesamte Registerspeicher bzw. der iiberwiegende Teil des Regi- 
sterspeichers (auBer dem Z-Register von Fig. 2) durch die Re- 
gisterspeicherkonf igurationseinheit als freier Speicher kon- 
figuriert, in dem dann andere Daten gespeichert werden kon- 
nen . 

Die Registerspeicherkonf igurationseinheit 20 ist ferner ange- 
ordnet, urn abhangig von dem verwendeten Kryptoalgori thmus An- 
zahl und Groiie der Operandenregis ter fur die arithmetische 
Einheit zu konf igurieren . Auch die Lange der Register unter- 
scheidet sich von Kryptoalgorithmus zu Kryptoalgori thmus . 
Wahrend bei einer RSA-Berechnung ohne chinesischem Restsatz 
(CRT) alle Register die voile Lange haben miissen (beispiels- 
weise 1024 Oder 2048 Bit), genugen bei einer RSA-Berechnung 
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mit CRT nur halb so lange Register, also Register mit einer 
Lange von 512 bzw. 1024 Bits. 

Im Falle von kryptographischen Berechnungen auf der Basis von 
elliptischen Kurven brauchen die Register nur eine viel kur- 
zere Lange, beispielsweise 160 oder 190 Bits. 

Die Registerspeicherkonfigurationseinheit 20 ist angeordnet, 
urn die Anzahl und Lange der Register iiber Befehle des Krypto- 
prozessors, d. h. der Steuereinheit 16, zu konf igurieren . Der 
nicht bendtigte Platz steht fur weitere Anwendungen zur Ver- 
fiigung, was, wie es ausgefiihrt worden ist, insbesondere fur 
Smartcards ein nicht zu unterschatzender Faktor ist, da sol- 
che Smartcards einen fliichtigen Speicher von nur zwischen 2 
und 4 Kilobyte haben, so daB bereits ein nicht benutztes Re- 
gister der Lange 2304 Bits dem Programmierer einer Chipkarte 
einen nicht zu vernachlassigenden zusatzlichen Speicherplatz 
liefert. Alternativ kann der Registerspeicher neben der Ver- 
wendung von Prozessorbef ehlen auch durch Setzen von Bits in 
Statusregistern etc. durch die Einheit 20 erfolgen. 
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